端到端相关论文
近年来,深度学习先进技术层出不穷促进着语音合成技术快速发展,机器发出的声音越来越接近真人的声音。然而,相比于汉语、英语等通......
同声传译在源语言说话人表述过程中同步进行翻译,显著改善了跨语种沟通交流的效率。随着通信、互联网技术特别是移动互联网的迅速......
本文提出了一种基于注意力的端到端韵律结构和重音联合预测方法,首次将韵律结构预测和重音预测统一到同一框架中。该方法是基于端......
为积极推动云改数转,建立并完善端到端的运维服务平台取代传统数据中心的服务平台,更好地满足终端客户差异化需求,持续提升客户体验,电......
当前广泛使用的Transformer模型具有强大的全局依赖关系捕捉能力,但其在浅层时容易忽略局部特征信息。针对这一问题,文中提出了一种......
齿轮箱故障诊断对于降低运维成本和提高设备运转效率至关重要。首先,提出了一种基于小样本数据的一维卷积神经网络(1DCNN)端到端故障......
传统离散型装备制造行业产品制造周期长,交付及时性差,一般采取备货生产模式,由此带来的结构性供需不平衡问题凸显,生产制造端响应速度......
语音识别是实现人机交互的一种重要途径,是自然语言处理的基础环节,随着人工智能技术的发展,人机交互等大量应用场景存在着流式语音识......
在5G SA网络商用推进逐步深入的大背景下,为满足集团客户借助5G大带宽低时延技术来实现专线业务的组网,江西联通进行了基于5G SA网......
近年来,快速发展的光学卫星已成为稳定、高效的对地观测系统中不可或缺的组成部分,这给人类观测地球带来了极大的便利。光学卫星影......
针对神经网络目标检测系统在硬件资源受限与功耗敏感的边缘计算设备中应用的问题,提出了一种基于现场可编程门阵列(FPGA)实现的YOLOv3......
多目标跟踪的一阶段方法因其在推理速度方面的优势逐渐成为主流。然而,与两阶段方法相比,其跟踪精度较差。一方面是因为采用单幅图像......
在海量视频、图像存在的多媒体环境下,图像压缩能够有效降低图像的存储空间、提高图像的传输速率,所以数字图像的压缩是图像处理中......
面对垂直行业多样化的业务需求,5G网络切片能够提供灵活、隔离、按需的服务,结合OTN、IPRAN/STN资源、云资源以及云网融合、固移融......
由于近数十年来我国经济水平的快速稳定发展,我国的城镇化发展进程得到明显加快,人均机动车保有量不断提高,但同时也一并面临着日......
近年来,无人机被应用到各行各业,深受普通民众的喜爱,无人机也逐渐朝着智能化的方向发展。在无人机智能化的方向中,通过人机交互的......
随着我国城镇化进程的加快,机动车的数量与日俱增,交通和安全问题也越来越严重。无人驾驶作为人工智能技术的新产物,有望缓解上述......
随着互联网的普及,越来越多的人选择在线上进行消费、娱乐、社交以及学习,同时也在各类网络平台上留下了大量的评论文本。这些海量......
针对传统的语音识别系统采用数据驱动并利用语言模型概率来决策最优的解码路径,在部分场景下解码结果存在明显的音对字错的问题,提出......
随着信息技术的发展,人机对话系统已经广泛应用于多种领域,如在车载环境下通过人机对话帮助驾驶员导航、调节车窗等以降低事故风险......
现阶段,许多场景文字检测模型和文字识别模型是相互独立的两个网络,无法利用两个任务之间的关联信息,而端到端的文本检测识别网络,......
文字,自从其产生以来,一直是人类文明延续的象征,更是人与人之间进行沟通过程中提供信息的重要载体。近年来,随着深度学习的不断崛......
针对传统的雷达信号分选方法严重依赖预置的参数和先验信息,结构前后互相制约不灵活的问题,提出一种基于深度分割的端到端雷达信号分......
作文智能批改的需求与日俱增,然而目前针对不规范书写的中文手写作文识别任务尚未有一套完善的解决方案。篇幅级识别任务大多是针......
主动跟踪系统能够主动地、有目的地调整相机参数实现目标跟踪,在大范围智能监控、大尺度移动目标跟踪领域应用广泛,如何获得目标参......
深度学习的发展提高了计算机处理图像的能力,拓展了计算机视觉的应用。同时,基于视觉任务的端到端的自动驾驶技术也在不断地发展。......
随着注意力机制在自然语言处理等领域的成功应用,基于注意力的端到端语音识别吸引了广泛的关注。然而现有的研究主要是应用于英语......
智能问答是指计算机通过分析用户提问,自动回答用户所提出的问题,是一种高级形式的信息服务。知识图谱本质上是一种围绕特定实体所......
图像中目标分辨率的缺乏对传统目标识别算法的性能造成了严重的影响,特别是在远距离的广角监控视频、无人机远程、航空影像等场景......
随着网络结构不断发展,数据中心网络(DCN)可以为全球用户提供服务,但是当流量突然爆发时,内部的网络拥塞是不可避免的。为了有效管理......
随着人工智能的兴起,语音识别成为人工智能应用的一个重要领域。目前,语音识别在智能家居、智能车载和社交聊天中有着广泛的运用。......
语音识别是模式识别和应用数学的交叉热点课题,端到端的语音识别系统在连续语音识别领域越来越受关注。如何构建更有效的序列到序......
文本生成图像问题是图像生成方向的一个重要分支,给定一个文本描述,可以生成符合文本描述的图像。文本生成图像的方法主要是基于生......
在当今这个大发展、大融合的社会,需要人们能够说一口标准的国家通用语,以便对话双方能够精准理解,因此提升国家通用语发音水平已......
自动语音识别是将语音序列转换为文本序列,是实现人机交互的关键技术。当前,随着人工智能的发展,汉语、英语、日语等主流语言的研......
自动语音识别技术发展至今日,无论是在传统混合语音识别架构还是新兴的端到端识别架构上,在声学语料充足、资源丰富的语言上,均已......
随着深度学习的发展,相比于传统的基于大词汇量连续语音识别的关键词检索方法,基于深度学习的关键词识别方法变得流行起来。传统的......
随着蒙古语智能信息处理技术的飞速发展,蒙古语语音合成技术已经达到实际应用水平,可以合成高音质的语音,但是情感表现力还有待提......
随着人文交流日益密切,双语或多种语言混合表示成为了一种常见的语言现象。在国际上,汉英、英德、英法等混合语言运用越来越普遍。......
文字是人类用表意符号记录表达信息以传之久远的方式和工具,是信息传递的载体。自然场景下端到端文本检测与识别算法的应用越来越......
当前全球广泛发展无线网络通信,基于TCP/IP通信协议的各类业务也得到相应推进。在无线网络上开展IP业务,TCP/IP通信协议的信令开销......
随着科技水平的发展,水下探测已经成为世界范围内一项重要的科学探测工作。水下光学成像是开展水下科探的重要手段之一,其图像质量......
近年来,随着计算机视觉和自动化等技术的迅猛发展,自动驾驶技术逐渐走入了大众的视野。安全性是自动驾驶首要关注的问题,安全性水......